上一篇得知平均票價32美元 , 這跟我認知中鐵達尼號的樣子真的是差很多XD
藉由dplyr包我們也可以快速理解一下票價的關係
#以社經地位統計平均票價
raw %>% group_by(Pclass) %>% summarise(平均票價 = mean(Fare))
# A tibble: 3 x 2
Pclass 平均票價
<int> <dbl>
1 1 84.2
2 2 20.7
3 3 13.7
Pclass 社會經濟地位等級(1:高等、2:中等、3:低等)
目前以社經地位平均票價來看 , 社經地位越高確實平均票價都會比較高
那如果以存活與否呢...?
raw %>% group_by(Survived) %>% summarise(平均票價 = mean(Fare))
# A tibble: 2 x 2
Survived 平均票價
<int> <dbl>
1 0 22.1
2 1 48.4
Survived 是否存活(0:否、1:是)
好吧!太殘酷了...我不忍看
確實都是與票價有關係的....